花费 6 ms
pytorch 不同学习率设置方法

最近注意到在一些caffe模型中,偏置项的学习率通常设置为普通层的两倍。具体原因可以参考(https://datascience.stackexchange.com/questions/23549/w ...

Wed Nov 14 00:00:00 CST 2018 0 6098

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM